iT邦幫忙

2024 iThome 鐵人賽

DAY 21
0
Software Development

想要工作更輕鬆? 跟著我一起用 Power Automate 自動化吧!系列 第 21

Power Automate 也能爬蟲?!利用某購物網站作為題目(中) #僅為教育目的

  • 分享至 

  • xImage
  •  

💡 在本文章你將學到:利用 Action: HTTP 觀察 HTML 內容並取得所需資訊
本範例要擁有商務/公司帳號以及須額外付費
本文章僅為教育目的

前言


在本篇,我們先單獨利用 Action: HTTP 取得 HTML 原始資料,並且一層一層剝開後取得資訊

內文


html 2 text

透過上篇我們已經觀察到<div class="RushbuyItemContainer__RushbuyItemContainer___2J94F"> 裡面裝的就是各項商品的資訊,因此我們先將 HTML 分割出我們要跟不要的資訊,這邊我們利用 split() 語法,根據官方文件,公式是長這樣的 **Split**( *Text*, *Separator* ) ,第一個參數放入待分割的字串,第二個參數提供分割字元依據。

**Split**( *Text*, *Separator* ) ,第一個參數放入待分割的字串,第二個參數提供分割字元依據

在我們這個案例來說,第一個參數就是放入 HTML,也就是在 ⚡ 找到的 Output(’body’),而第二個參數就是 <div class="RushbuyItemContainer__RushbuyItemContainer___2J94F">

到目前進度,各位可以 Save & Test,查看是否運作順利,你也會發現確實去除掉不少不需要的訊息。

不過,我們現在還是獲得許多不必要的 HTML 語法,這邊的話 Power Automate 有個懶人工具 — HTML 解析工具,也就是 Action: HTML to Text,我們只要將 HTML 丟給這個 Action 之後,他就會協助我們完全去除 HTML 語法,給予純文字結果。那麼問題來了,由於剛剛我們 Split 已經篩選掉開頭的 <div class="RushbuyItemContainer__RushbuyItemContainer___2J94F"> ,對於這個 Action 而言,就不能說是完成的 HTML 語法,因此我們還需要再將 <div> 加回去,這邊我們就用到第二個公式了 — Concat(),這邊也有官方文件教學,使用方法也很簡單,只要將欲合併字串依序提供即可

ConcatTableFormulaseparator),依序放入欲合併字串

因此最後語法如下,執行過後你就能取得純文字的商品資料了,我們下一次再與大家分享如何整理資訊吧!

concat(last(split(body('HTTP'),'<div class="RushbuyItemContainer__RushbuyItemContainer___2J94F">')), '<div class="RushbuyItemContainer__RushbuyItemContainer___2J94F">')

上一篇
Power Automate 也能爬蟲?!利用某購物網站作為題目(上) #僅為教育目的
下一篇
Power Automate 也能爬蟲?!利用某購物網站作為題目(下) #僅為教育目的
系列文
想要工作更輕鬆? 跟著我一起用 Power Automate 自動化吧!31
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言